配合
28-面试题全集与岗位需求.md使用。本文件只有口诀+关键词+数字,不展开解释。
遇到不理解的条目,去主文档查完整答案再回来背。
速记原则
数字锚定法:每个知识点绑定一个数字(3层、5步、2机制) |
一、Agentic Loop —— 7 步口诀
口诀:「输构调解有工无停」
输 → 用户输入进入 query() |
追问速答:
- Loop 何时终止?→ 3 无:无 tool_use / 无更多轮 / 无信号(被 abort)
- 工具怎么并行?→
Promise.all(toolCalls.map(...))但 computer-use 有全局锁
二、工具权限 —— 3 层口诀
口诀:「静动人,快中慢」
静 → Layer 1 静态白名单(allowedTools 配置)→ 直接通过,最快 |
3 态:Allow / Deny / Ask(记住不是 Yes/No,是三态)
YOLO 模式 = bypass Layer 2 + Layer 3(全自动批准,危险!)
三、System Prompt —— 5 层口诀
口诀:「身工规忆境」(越靠前越稳定 → 越容易缓存)
身 → L1 Core Identity(最稳定,永远缓存) |
Prompt Cache 原则:稳定内容放前面,动态内容放后面 → 最大化 prefix match 长度
四、Session 持久化 —— 双轨口诀
口诀:「JSONL 不丢,墓碑判活死」
轨道 1 — JSONL(只追加,不覆盖): |
恢复 3 步:读 JSONL → 重建 messages → 从断点继续(不从头)
五、上下文压缩 —— 2 机制口诀
口诀:「预算警告防,SNIP 删减治」
预防(Token Budget): |
六、多 Agent 协调 —— 2 模式 3 协议
2 模式:
inProcessRunner = 同进程,共享内存,快,适合信任的子 Agent |
Swarm 3 协议(CC 的实现):
1. TeamFile → Leader 写 plan.md,Teammate 认领任务(文件即协调) |
口诀:「文件邮箱权集中」
七、MCP 协议 —— 3 能力 2 传输
3 能力(口诀:工资提):
工 → Tools(工具,模型可调用的函数) |
2 传输:
stdio → 本地子进程(CC 默认,零网络开销) |
与 REST API 的区别(一句话):
MCP = 工具自描述 + 模型动态发现 + Schema 驱动调用;REST = 人工调用,模型不能自主发现
八、流式 SSE 处理 —— 4 要点
口诀:「缓解错终」
缓 → buffer 处理跨 chunk 的不完整行(不能直接 split \n) |
手写模板:
buffer += decoder.decode(chunk, { stream: true }) |
九、错误重试策略 —— 4 分类
口诀:「429 等,529 分,4xx 停,网络重」
429(Rate Limit) → 指数退避 + 读 Retry-After header |
十、Prompt Cache —— 2 数字
命中后速度:快 5-10 倍 |
触发条件:请求的 system prompt 前缀与上一次相同 → 命中
十一、LLM 理论速记
Transformer 核心(3 个必背公式概念)
1. Self-Attention:Attention(Q,K,V) = softmax(QK^T / √d_k) × V |
RLHF 三步(口诀:「监奖强」)
监 → SFT(监督微调):用人类示范数据训练初始模型 |
DeepSeek 特色(面试必备)
MoE 口诀:「稀激路专」
稀 → 稀疏激活(每次只激活部分专家,节省计算) |
MLA(Multi-head Latent Attention):
目的:压缩 KV Cache 显存占用 |
Reasoning 模型(DeepSeek-R1)口诀:「思链奖,拒蒸馏」
思 → 让模型生成 Chain-of-Thought 思维链 |
十二、Python 异步速记
asyncio 4 件套(面试必写):
# 1. gather(并发等所有) |
十三、算法速记(必写 5 题)
LRU Cache —— 口诀:「哈希链,头新尾旧」
class LRU: |
令牌桶 —— 口诀:「时间差补桶,取多则等」
def consume(self, tokens): |
滑动窗口限流 —— 口诀:「队列删旧,长度判限」
def is_allowed(self, user_id): |
一致性哈希 —— 口诀:「虚节点散,顺时针找」
# 关键:150 个虚节点防倾斜 |
Top-K —— 口诀:「最小堆,大于堆顶才换」
import heapq |
十四、系统设计答题模板
口诀:「假架存容监」(5 步必说)
假 → 先说假设(QPS 多少?数据量多大?延迟要求?) |
面试加分句型:
- “Claude Code 的 X 模块就是这样设计的,原因是…”
- “这里有个 trade-off:A 方案快但无法恢复,B 方案慢但崩溃安全…”
- “我们可以从 metrics 出发定位瓶颈,而不是盲目优化…”
十五、高频数字速记表
| 数字 | 记忆点 |
|---|---|
| 3 | 权限三态(Allow/Deny/Ask)/ 重试次数上限(529 前台)/ Agentic Loop 终止条件 |
| 5 | System Prompt 5 层 / 系统设计答题 5 步(假架存容监) |
| 2 | 上下文压缩 2 机制(Budget + SNIP)/ Session 持久化 2 轨道 / MCP 传输 2 种 |
| 7 | Agentic Loop 7 步(输构调解有工无停) |
| 85% | 上下文压缩触发阈值(AUTOCOMPACT_THRESHOLD) |
| 90% | Prompt Cache 命中省成本比例 |
| 5-10× | Prompt Cache 命中后速度提升 |
| 32s | 重试退避最大等待时间上限 |
| 6h | 持久化模式 529 重试时间上限(PERSISTENT_RESET_CAP_MS) |
| 150 | 一致性哈希虚节点数量(防倾斜) |
| √d_k | Attention 除以它防 softmax 饱和 |
十六、30 分钟速记计划
分钟 01-05:读完一~四(Agentic Loop + 权限 + SystemPrompt + Session) |
十七、面试前 10 分钟最后检查
闭眼能说出(不看文档):
- Agentic Loop 7 步口诀:「输构调解有工无停」
- 权限 3 层:「静动人,快中慢」
- SystemPrompt 5 层:「身工规忆境」
- Session 双轨:JSONL 只追加 + 墓碑判崩溃
- 上下文压缩 2 机制:预算警告 + SNIP 删减
- MCP 3 能力:「工资提」(工具/资源/提示)
- RLHF 3 步:「监奖强」
- MoE 核心:「稀激路专」
- 系统设计 5 步:「假架存容监」
- Top-K 时间复杂度:O(N log K),最小堆实现


